#poda de caché

DepthKV: Poda de caché KV dependiente de la capa para inferencia de LLM de contexto largo

DepthKV reduce el uso de memoria en LLMs de contexto largo mediante poda por capas del caché KV. Optimiza eficiencia sin perder precisión.